home *** CD-ROM | disk | FTP | other *** search
/ ftp.whtech.com / ftp.whtech.com.tar / ftp.whtech.com / articles / The Economist / Chips that speak and hear.txt next >
Text File  |  2007-12-19  |  3KB  |  48 lines

  1. The Economist
  2.  
  3. August 22, 1981
  4.  
  5. Chips that speak and hear
  6.  
  7. SECTION: Business, finance and science; SCIENCE BRIEF; Pg. 80 (U.S. Edition Pg. 72)
  8.  
  9.  
  10. "Here is the news"
  11.  
  12. So far, most speech-synthesis chips have gone into electronic toys and learning 
  13. aids. Incorporating them into arcade games like Space Invaders is this year's fad. 
  14. Some have also been purchased by companies experimenting with speech applications 
  15. for cars, cookers and automated bank tellers. One application stands out as the 
  16. biggest challenge yet for speech-synthesis experts: the text-to-speech translator--
  17. in effect, a reading machine. One such translator which will be on the market in 
  18. September can be attached to Texas Instruments' home computer, the TI 99/4. The 
  19. translator, which will cost around $200, reads aloud any news or information 
  20. displayed on the computer's television screen.
  21.  
  22. Two steps are usually involved in converting text to speech. First, special rules 
  23. are followed to translate the letters of the text into binary numbers representing 
  24. component sounds. The components can be the sounds of complete words or phrases, 
  25. bits of words or variations of individual letter sounds. Second, the components 
  26. stored as binary numbers are strung together in the right groupings and sequences 
  27. depending on syntax. In TI's approach, the component sounds used are finely 
  28. differentiated. They come from a library of 128 sound elements called allophones. 
  29. The ''p'' in push and the ''p'' in Spain are different allophones of the phoneme 
  30. ''p''. Even so, the same words can sound wrong when uttered in a different context.
  31.  
  32. An even more ambitious reading machine has been developed by Professor Jonathan 
  33. Allen at the Massachusetts Institute of Technology. Called Mitalk, it can read not 
  34. only unrestricted English text or any word currently in the English language, but 
  35. also any future construction or even nonsense--including the poem Jabberwocky. 
  36. Mitalk's sound components are 7,000 root words, prefixes and suffixes called morphs 
  37. (eg, scarcity = scarce + ity). It produces intelligible and rather machine-like 
  38. speech, but is prohibitively expensive for most applications because it needs 
  39. 600,000 bytes of storage space for its morphs (one byte, equal to eight bits of 
  40. data, is required to define each letter). By contrast, the even less natural-
  41. sounding TI text translator needs only 3,000 bytes of memory for its allophones.
  42.  
  43. Professor Allen says Mitalk is modelled on a flat midwestern American accent, and 
  44. that it would take years to make it speak any other. What must Matsushita, a Mitalk 
  45. licensee, make of this limitation? A small Californian company called Telesensory 
  46. Systems is trying to make a scaled-down version of Mitalk as an aid for the blind.
  47.  
  48.